2008/07/24

風起雲湧誰先知?

標題那句話是某個名教授實驗室網站上的標語,意思當然是「他們」先知道了,不知道現在換了沒有?

最近台灣中南部淹大水,龍潭掉了一部 AH-1,讓我又想起過去那段報氣象的日子。

台灣的氣象報告準不準?這個問題實在不容易回答。

雖然客觀而言,我們可以紀錄所有預報跟實際觀測的差異,然後計算其誤差,但是「氣象報告準不準」其實是很主觀的感受:一個預報員即使每天氣溫、風向風速報得亂七八糟,只要在要下雨的時候報下雨,大概大多數人都會覺得報得準;反之另一個人即使每個氣象參數都報得相當精準,若是下雨的時候預報晴天,大概也是被罵到臭頭。換言之,對於一般老百姓來說,重要的是 impact,而不是「誤差值」這種客觀數據。

對於專業的預報員來說,當然是要用客觀的標準來檢驗才是公平,但是如果每每對於外界的抱怨,總是擺出一副「你們根本一點都不懂我們的專業」的高傲態度,好像也不是很好的作法(附帶一提,據謠言說中央氣象局預報中心是平均學歷最高的公家單位)。至於氣象局每次都說自己的颱風路徑預報比美國日本要準,我覺得也是一樣的問題:美國日本預報偏了一百公里可能沒差,該來的還是要來,可是在台灣偏了幾十公里可能就是晴空萬里跟狂風暴雨的差異,這牽涉到大家的生命財產安全,好像也不能用「民眾不懂專業」就搪塞過去。另外,美國跟日本只要在他們自己國家附近報得準就好了,在台灣附近報得沒有中央氣象局準應該是理所當然的事情,這真的是一點也不值得拿來說嘴。

那麼,氣象預報到底有沒有可能報得準?那得看「多準才算準」。如果因為氣象災害遭逢損失就要怪氣象預報不準,這個標準可能再高明的預報系統也達不到;試問:如果事先知道會下大雨,難道土石流就不會發生?顯然不是的。所以有很多事情也不能都賴在預報上。

另外,預報員也是人,做出預報的決策時當然也會受到很多非專業因素的影響:比方說颱風預報牽涉到是否停止上班上課,如果有來自高層的關切(可能上次颱風災情嚴重,或是放了假卻無風無雨),那麼預報員決策的風險傾向就會改變;又例如機場的氣象人員,商業航空公司停飛班機的成本很高,如果天氣不好,航班又多的時候,壓力其實也會很大。
說到這個我的經驗就不少了,不過夜深了,下次再說吧。

2008/07/22

好快刀


最近腦袋不太清楚,覺得還是暫時先寫點輕鬆的好了。

剛來的時候跟人買了把菜刀,幾乎什麼都用那把大菜刀來切,但是一方面用著用著覺得有點鈍了,另一方面用大刀切小東西總是感覺怪怪的,所以去挑了一把還不錯的料理用刀,上面還刻了「三德」,我覺得是想假冒日本刀。不過我好奇的是,德國的鋼材應該比日本好吧?

新刀刃寬比菜刀小得多,而刀背只薄一點點,用起來果然有庖丁上身的感覺,一把 10 歐元的刀果然比三把一美金好用多了(^_^),讓我不禁想讚嘆一句「好快刀!」。

《聊齋誌異》快刀

明末濟屬多盜,邑各置兵,捕得輒殺之。章丘盜尤多。有一兵佩刀甚利,殺輒導窾。一日捕盜十余名,押赴市曹。
內一盜識兵,逡巡告曰:“聞君刀最快,斬首無二割。求殺我!”
兵曰:“諾。其謹依我,無离也。”
盜從之刑處,出刀揮之,豁然頭落。數步之外猶圓轉,而大贊曰:“好快刀!”

想起了以前國文課本裡收的這一篇,幸好聊齋已經不受智財法保護了,可以一貼。當初看了這篇只覺得故事沒頭沒尾有點無趣,但是沒想到這麼多年了那個頭顱滾地還在說話的景象一直深深印在腦海裡。希望這把刀別把我的手指也切下來,我的手指肯定喊不出「好快刀」三個字。

2008/07/13

「感同身受」之必要

不知不覺的就偷懶了好久 ^_^|||,趁現在還記得的時候趕快把前一篇尾巴收一下。

先說在前面的是,這篇的內容根據的是我個人的經驗跟想法,目前有很多討論相關問題的科普書籍,但是因為還在「眾說紛紜」的階段,所以也沒辦法整理出足以編到教科書裡的共識。當然,這些想法也不是多複雜,僅僅是很直覺的詮釋,就姑妄聽之吧。

「感同身受」應該是人類大腦 pre-frontal cortex 所衍生出的功能之一,這個現代智人明顯比其他靈長類來的發達的腦部區域,目前有些專家認為重要功能之一是用來「模擬」各種行動可能的結果,而不用冒著真正親身去嘗試的風險。而這樣的「能力」隨著文明的發展,逐漸演變成「同情心」、「同理心」等等說詞,但是在本質上不脫「站在其他個體的立場來設想」(而不用親身去做)的特色。

這個「模擬器」的運作方式,從神經生理的角度來看,除了應該在前額葉之外,目前在細節上沒有比較明確的論述,但是哲學家跟心理學家對於這個系統的運作方式,自古以來就有相當多的理論與假設。根據上一篇的預告,這裡要講的當然是 schema theory,這種「人類心智會形成對於外在世界的運作產生內在詮釋」的想法,遠自柏拉圖時代就有了,而近代發展心理學家 Jean Piaget 對於這個機制做了進一步的定義與詮釋,用來解釋兒童對於外在世界認知的發展歷程

簡單的說,Piaget 將我們對於外在世界的解釋,稱作 schema,最早可能是由遺傳及幼年經驗來決定,然後依據個人成長的經歷,進行調整。這個認知架構的調整,主要透過兩個不同的機制:assimilation 是把原本的 schema 套用在新的資訊上,accommodation 則是修正原本的 schema 來符合新的資訊。這樣的想法在概念上相當容易理解:當我們觀察到一件事情,與我們的預期有牴觸時,要嘛就是把這件事當作例外(assimilation),不然就是修正我們做出該預測所基於的假設(accommodation)。

雖然目前沒有明確詳細的神經生理證據來支持這個系統的存在,但是我個人覺得應該只是「尚未發現」。一方面是因為這個系統相當的直覺,另一方面這幾年 artificial intelligence 領域裡當紅的 statistical learning 和 belief network 大可以為這個系統的數學(或者該說是物理)正確性背書。一個人對於外來資訊究竟是採取 assimilation 或是 accommodation,概念上可以理解為 Baysian statistics 裡 prior 的強度,而在實作上可能反映為 network 的結構,而 network 恰好又是腦神經具體存在的方式,因此我自己猜測這樣系統實際存在的可能性是很高的。

這樣的系統會隨著一個人的成長而愈趨穩定,也就是越來越傾向於多用 assimilation,而少用 accommodation,這在常識上也很容易理解。因此,我們也就越來越吝於花費時間精力去「傾聽」或「理解」別人的想法與感受,甚至對於「意料之外」的事情直接加以否定或是曲解。(這些人類在認知上「不理性」的行為自80年代以降累積了相當多的研究,倒也不是我自己憑空捏造或是臆測的。)

我自己的觀察是,通常一個人越覺得自己成功,對於已有的 schema 的堅持就越強,這想來也不難理解。「自信」與「自負」、「自大」描述的很可能是相同的行為,只是給評價的人認同或不認同被評價者的 schema 的差別罷了。不過同樣不難理解的是,當一個人採取 assimilation 或 accommodation 策略的比例過度失衡,這個人可能會變成思想過度僵化(因而導致判斷錯誤)或是缺乏定見(因而效率偏低),都不是什麼好事。

「感同身受」的能力自有其演化上的意義,而「站在別人的立場設想」必須建立在我們對「他人立場」的詮釋上。這種「詮釋」源自我們心智中對於「世界如何運作」的既定看法,而這些看法會根據我們的經驗不斷的增強與修正。有趣的是,一旦這些看法漸趨穩定不變之後,我們「感同身受」的能力似乎也逐漸僵化,這在某個抽象的層次上恰好反應了 statistical learning theory 中的 bias-variance-trade-off,顯示了我們的認知系統也是在 efficiency 與 generalizability 中尋找平衡。

所以,如果我們發現自己越來越缺乏同理心,往好處想:至少我們的自我感覺還蠻不錯的(覺得自己還算成功),才會捨棄 accommodation 而多用 assimilation。

2008/07/08

漸漸消失的同理心

跟朋友聊天,談到了這個問題。

他說:「我發現自己好像越來越沒有同理心,跟我價值觀不符合的事情,好像就覺得『不值得同情』。」

聊著聊著,發現大家多多少少都有這樣的問題,雖然吾等(曾經是)念心理學之輩,或多或少都覺得自己是個不錯的「傾聽者」(至少,曾經是),但是隨著年歲增長,大家對於「不在個人認知架構內」的事情都越來越忽視,甚至很容易反感。

我自己對這件事的看法是「人的心智本來就是這樣運作的」。然而,這段談話,讓我想起了當初為甚麼想要念心理學的原因。

國高中的時候我大概算是問題學生,不是打架抽煙混幫派那種,而是「想法跟別人不一樣」那種。不過無論是哪一種,在台灣問題學生的下場大概都差不多,最後學校的輔導老師跟我講不下去,打電話要我父母帶我去看精神科。

當時我很不服氣,我覺得自己連「叛逆的青春期」都算不上,只是對於「選擇跟大家一樣的道路」有所懷疑,試圖提出不同的可能性而已;而從事輔導工作的人,根本不想瞭解我的想法是什麼,只是一味的要說服我「回歸正途」,等到講道理講不贏的時候,就要當事人去精神科掛號。這樣的事情對一個 16 歲的孩子來說,好像是太沈重了些,雖然後來真的念了心理系之後,發現去看精神科其實沒什麼大不了的,而輔導老師束手無策之餘建議尋求專業協助也是合理的作法。

就在那段時間,我對人的心智產生了很大的興趣,很想知道「為什麼人不能接受不一樣的想法?」,「為甚麼我們不願意花時間精力真正去理解別人在想什麼,總是憑著片面的資訊就要做出判斷?」,「為甚麼我跟別人不一樣?」

匆匆的,十幾年就過去了,我跳進心理學的圈子裡沾了沾又跑了出來。前兩個問題,我大致上有了還可以接受的解釋;至於第三個問題,我沒有什麼好的答案,但是至少我知道,「每個人都是不一樣的」,而且由於自身的經歷,我也樂於去接受與欣賞(甚至有點鼓勵)每個人的與眾不同之處。

人的心智運作,又為甚麼讓我們不容易保持著同理心呢?這可就說來話長了,概念的理解上,可以從 Piaget 的 schema 談起;在數學上,statistical learning theory 提供了很好的類比,Bayesian Networks (Belief Networks) 也是很好的模擬工具。不過既然說來話長,那就等有空再說吧。(偷懶中...^_^)

2008/07/07

越寫越健康

科學人上面的這篇報導「部落格越寫越健康」,敘述了陸續有研究發現「書寫」對於身心健康是有好處的,但是對於背後的機制目前瞭解還不多。

自己寫 blog,大概是從 2004 年初開始的(其實我已經不記得了,是從自己 profile 的註冊日期看來的 ^_^)。那個時候,e-mail 已經成為人人都有的通訊工具,電子報盛行,朋友之間也常常轉寄有趣的文章。當文章收集多了,就會想要有個好用的介面來分類整理,以方便將來的搜尋與閱讀,最好是能夠轉成 Web-based 型態,然後在瀏覽器裡直接選取收集的文章來看。

當時人在芝加哥,正在開發一個 JSP-based project management system,雖然說 web-server + database 是個不錯的 solution,還有「搜尋」的功能可用(當時還沒有 Google desktop),但是總覺得在 P3-1GHz 的小 laptop 上跑一堆 server 有點累贅的感覺。

那個時候,還不知道 Blog 這個字。

身為 software engineer 跟 open source 愛好者,當然是先上 source forge 找找看有沒有符合需求的工具或是相似的點子可供參考,找著找著就找到了 blog 這個字,然後過幾天就看到了 Google 買了 blogger 的新聞。當時二話不說就去網站上註冊,開始了網路書寫。

一開始的時候,沒有什麼自己寫的東西,大多是轉貼網路上看到的文章,因為我本來也就只是要找個電子剪貼簿來用而已;後來網路的發展更趨蓬勃,許多相關的規範也逐漸成形,我也很守規矩的把「公開轉貼」改成「提供網址」,到現在的用 RSS 來轉載 Google Reader Shared Items(在右邊的欄框裡);至於當作電子剪貼簿用的 blog 我還是留著,只是權限改成 private,只有受邀請者可以看得到,以避免「散佈」的法律問題。而這個 blog,也逐漸演變成「日記」的型態。

到了 2004 年底,blog 就變成了當紅的字眼了,令人驚訝於網路時代變化之迅速。


書寫本身,對我來說一直不是太大的問題,主要是因為高中時期寫了非常大量的文字:四本厚厚的日記,加上一箱的書信(那只是我收到的回信,我寫了寄出去的應該有四~六倍吧),估算一下應該有數十萬字。

當時,總覺得不被人瞭解,所以花了好多的心思去寫自己的想法,解釋自己為甚麼會這麼想、這麼做。回想起來,結果只是徒勞。不過,如果我現在的文字讀起來還算通順,大概都是靠那段苦悶的歲月裡蹲馬步蹲出來的。


幾年前退伍,準備要出國的時候,把這些書信日記大部分都處理掉了。依稀記得當時好像非常果決,甚至連火化的省了,直接送進資源回收。當時只是單純的覺得「不然等我回來也只是發霉」而已。既然這些文字已經完成了當時的階段性任務,to keep my world from falling apart,那麼就讓它們隨著那段歲月消逝吧。

2008/07/06

Numb3rs 的社會貢獻


又到了工商服務時間,這次是捲毛數學家與 FBI 合作辦案的影集,Numb3rs。目前已經演了四季,還蠻受歡迎的,第五季預計今年九月開播。台灣 AXN 有演,片名好像是叫做「數字緝凶」。

比較值得一提的,是這部影集在 2006 和 2007 年得了兩個關於「向社會大眾推廣科學」的獎項。我第一次看到這部片,第一個感覺就是:這是美國人鼓勵下一代念科學的「宣傳片」吧?每集當中,主角都用不同的數學方法來協助 FBI 破案,讓大家比較能產生「啊,數學原來也跟生活息息相關呢~」的感受,當然劇中的俊男美女也試圖打破一般人對數學家 "they are nerds" 的形象。

剛看這部影集的時候,覺得題材非常新鮮,但是對於編劇把各種數學方法近乎「神化」的描寫也有點感冒。我相信編劇群一定有請數學教授當顧問,基本上也不會提供太過離譜的訊息,但是「把罪犯犯案的型態用統計模型分析,然後預測下一個受害者」,基本上是不太容易在現實中做到的。 Statistical learning 是可以用來找 pattern 沒錯,前述命題在邏輯上也是可行的,但是「犯案型態」與「線索」的分析其實是很花時間的,在「限期破案」的壓力以及「人命關天」的風險之下,數學工具是不是能像片中描述的這麼神,我其實沒有很大的信心。

不過無論如何,這部影集顯然對於提昇美國學生對於數理的興趣有不小的幫助,而看到自己學過的各種數學模型、演算法變成大家至少「聽說過」的東西,感覺也是挺不錯的。另外,如果已經有建立好的犯罪案件資料庫,要從當中去做系統化的 data mining 然後作為將來辦案的參考,其實也是個不錯的方法。至於諸多已開發國家面臨理工人才荒的問題,之後再另外討論吧。

2008/07/03

那些難忘的旋律

大多數人應該都有這樣的經驗:無意中聽到一段熟悉的旋律,卻勾起了深藏心底的回憶,以及種種的情緒。這樣的現象,一般認為是因為這些旋律和特殊的事件通時發生,形成了經驗的一個部份,因此當聽到旋律時,經驗的其他部份也會隨之浮現於意識之中。(當然,也有人相信這單純是音樂的魔力)

今天看到一篇票選 1932-2007 年台灣重要流行音樂的介紹,除了懷舊之外,也發現我幾乎在 2001 年之後就逐漸與流行音樂脫節了。

這幾天有個 UC Davis 來的教授 Petr Janata,介紹了他自己一系列關於「音樂引發的記憶與情緒」的研究(其中有一篇是發表在 Science 上的),內容相當有趣。

他的音樂結構分析是建立在 tunal torus(torus 是看起來像甜甜圈的幾何結構)的基礎上,而這個 torus 是 1998 年一個研究音樂知覺的學者提出來的,相對於西方音樂中的 12 個半音構成的環,人對於各個和弦的知覺可以用數學的方式呈現在平面上,然後捲成一個甜甜圈狀。點選前面的連結有比較詳細的說明,對於 Music IR 有興趣的朋友應該可以參考一下,這或許是個用來分析音樂結構蠻適用的framework。

Janata 的研究是利用歌曲在 torus 上的 topology 去對應聆聽時 fMRI 的 topology,然後試圖找出「被音樂勾起回憶」的神經生理機制,結果發現腦部主要活動的區域跟進行「辨識」的行為時類似(medial prefrontal cortex, MPFC),而前運動區(pre-motor area)也有不少的活動。

相較於腦功能的探索,Janata 的前置作業其實對做 MIR 來說是比較有趣的。他請了將近四百位大學生來參與實驗,在線上音樂資料庫裡尋找這些人 9~16 歲時排行榜上的歌曲,然後請受試者報告聽到歌曲時的回憶以及情緒。

整體而言,歌曲所引起的情緒大多都是正面的居多,引起的回憶大多數跟戀愛有關(20歲左右的大學生還能有什麼其他的回憶呢?);雖然每首歌曲對每個受試者的影響不盡相同,但是有少數幾首歌對大多數的受試者都引發相似的情緒與回憶。然而若要找出引起特定情緒的旋律結構,則需要設計更進一步的實驗,以及更多的受試者參與。

附帶一提,對於從工程角度來做 MIR 來說,比較困難的是 retrieve 出與人的感受有關的 information,以及分析、詮釋這些感受的向度;然而這些工作其實在其他領域已經有相當成熟的程序與方法,所以「合作」其實會是方便又迅速的方法。

2008/07/01

到底是誰做決定?

這個問題說起來有點抽象,主要是來自於我樓上另一個團隊的研究:他們發現在受試者「意識到自己做出決定」的七秒鐘前,就可以由 fMRI 的影像分辨出該受試者將會做出什麼決定。

研究的成果刊登在今年四月的 Nature Neuroscience 上,簡介可以由此去

實驗很簡單,受試者在 fMRI 的機器裡,可以自由決定用左手或右手按鈕,以及何時按鈕,並且在按紐之後報告自己做出決定的時間點。有了決定跟做決定的時間之後,就可以拿按鈕之前的 fMRI 資料來分析,看 classifier 是否能正確的做出預測,結果是 -7 秒(以做出決定的時間為 0)的時候即有夠高的預測準確度。至於實驗的細節請參考該篇論文的全文

「在你做出決定之前就知道你的決定」聽起來就有點玄了,何況這個發現也間接質疑了「自由意志」的存在:如果我大腦裡發生的某些化學反應「造成」了我所做出的決定,那麼其實就不是「我」基於「自由意志」做出這個決定,而是「某些化學反應」做出了決定,「我」只是「意識到這些決定」,並且產生了「是我做出這個決定」的假象。

這在商業上可能很有用,一旦找到了腦部作決定的機制,廠商只要利用特殊拼的電磁波、香味或是影像,就可以讓人去買某種產品,還覺得「這真的就是我喜歡的東西」。

好像越說越玄了,不過「自由意志」一直以來被視為是「靈魂」的一種表現,簡單的講,如果沒有所謂的「自由意志」,那麼人類只不過是某種設計精密的機器,就像佛家所言,「我」其實是種「執」。

至於這個發現能否推翻「自由意志」的存在,坦白說,這個問題哲學家們吵了多少個世紀仍然是處在信者恆信的狀態,所以也不必太在意了。就算「我」的存在只是虛幻,總不能就因此躺在地上等死吧?至於到底是誰做決定,就當是上帝的意志也不錯呀!

GPU 運算

GPU 的設計,基本上就是「對圖形運算最佳化的 CPU」,利用影像每個像素可以獨立計算的特性,以及在計算精確度上的妥協,來換取同時大量的平行計算。這樣的設計,原本是用來減輕 CPU 的負擔,但是隨著技術的成熟,現在似乎有取代 CPU 成為計算主角的趨勢。

上星期聽同事提起的,比利時 University of Antwerp 有人組裝了一台裝了四張雙 GPU 顯示卡的超級桌上型電腦,實驗室的人還拍了短片來介紹,有興趣的可以由此去。硬體的規格主要是 MSI 的 NVIDIA 790i 晶片主機板,四張 MSI 9800GX2,AMD Phenom 9850,四條 2G DDR2,外加聯立的機殼跟 1500W 的電源供應器。執行 3d 運算的效能跟該校在 2005 年以 350 萬歐元購買的 256-node cluster 旗鼓相當。

除了硬體的部份之外, nvidia 的 CUDA (http://www.nvidia.com/object/cuda_home.html#) project 提供了使用 GPU 進行運算的專門編譯器,網站上也收集了目前各種已經發表的應用,以及該應用比只用 CPU 計算增快的倍數。

從 CUDA 收集的資料可以看出,凡是問題本身可以平行處理、精確度誤差不會累積的,計算速度都得到大幅的提昇(從數十倍到百倍),但是以數值積分為主的應用,比方說天氣預報,就只有 1.3 倍的加速。

目前 CUDA 只支援到 float,但是預計年底前可以支援 double precision,屆時再看看能有什麼突破吧!